package com.crrc.util;

import org.apache.tika.Tika;
import org.apache.tika.exception.TikaException;

import java.io.ByteArrayInputStream;
import java.io.File;
import java.io.IOException;
import java.io.InputStream;

/**
 * TIKA方法 可以读取文件中的文字信息
 */
public class ReadOfficeUtil {
    /**
     * 需要传一个文件路径 必须是File 类型
     * @param file
     */
    public static String readOffice(byte[] file) throws IOException, TikaException {
        InputStream sbs = new ByteArrayInputStream(file);
        if(file == null){
            return null;
        }
        Tika tika = new Tika();
        String s = tika.parseToString(sbs);
        return s;
    }
}
